ماتریس درهمریختگی
در حوزهٔ هوش مصنوعی، ماتریس در هم ریختگی (به انگلیسی: confusion matrix) به ماتریسی گفته میشود که در آن عملکرد الگوریتمهای مربوطه را نشان میدهند. معمولاً چنین نمایشی برای الگوریتمهای یادگیری با ناظر استفاده میشود، اگرچه در یادگیری بدون ناظر نیز کاربرد دارد. معمولاً به کاربرد این ماتریس در الگوریتمهای بدون ناظر ماتریس تطابق می گویند. هر ستون از ماتریس، نمونهای از مقدار پیشبینی شده را نشان میدهد. در صورتی که هر سطر نمونهای واقعی (درست) را در بر دارد. اسم این ماتریس نیز از آنجا بدست میآید که امکان این را آسانتر اشتباه و تداخل بین نتایج را مشاهده کرد. در خارج از هوش مصنوعی این ماتریس معمولاً ماتریس پیشایندی (contingency matrix) یا ماتریس خطا (error matrix) نامیده میشود.[۱]
در مباحث هوش مصنوعی از این جدول برای تعیین مقدار شاخصهای ارزیابی مانند دقت (Precision) و صحت (Recall) استفاده میشود. دقت عبارت است از اینکه "چه میزان از نمونههای انتخابی درست هستند" و صحت بر این مفهوم که "چه میزان از نمونههای صحیح موجود انتخاب شده اند" دلالت دارند. البته ممکن است در منابعی، Accuracy نیز دقت ترجمه شود که مفهومی کاملاً متفاوت داشته و بر میزان نمونههایی اشاره دارد که سیستم در تشخیص آنها موفق بودهاست. [۲]
مثال
[ویرایش]فرض کنیم الگوریتمی برای کلاس بندی بین گربهها، سگها، خرگوشها طراحی کردهایم. فرض کنیم در این مثال ۸ گربه، ۶ سگ و ۱۳ خرگوش داریم. در سطر مربوط به گربهها، ۵ مورد به عنوان گربه و 3 مورد به عنوان سگ دسته بندی شدهاند. در صورتی که در سطر مربوط به خرگوشها، تنها چند مورد اشتباه وجود دارد. به سادگی مشاهده میشود که عملکرد الگوریتم در تمییز دستههای خرگوشها نسبت به گربهها بسیار بهتر است. مشخص است که اعداد روی قطر اصلی ماتریس نمایش تعداد کلاس بندیهای درست هستند. لذا در صورتی که تمام اعداد غیر روی قطر اصلی صفر باشند، الگوریتم دارای دقت حداکثر است.
برای بدست آوردن Performance یک دسته بندیکننده کافی است مجموع عناصر قطر اصلی را بر مجموع کل عناصر ماتریس تقسیم نمود.
کلاس پیشبینی شده | ||||
---|---|---|---|---|
گربه | سگ | خرگوش | ||
کلاس واقعی class |
گربه | ۵ | ۳ | ۰ |
سگ | ۲ | ۳ | ۱ | |
خرگوش | ۰ | ۲ | ۱۱ |
واقعیت | ||||||
جامعه آماری | در واقعیت مثبت | در واقعیت منفی | شیوع = Σ Condition positive/Σ Total population | صحت (ACC) = Σ True positive + Σ True negative/Σ Total population | ||
پیشبینی | پیشبینی مثبت |
مثبت صادق | مثبت کاذب خطای نوع اول |
Positive predictive value (PPV), دقت و بازیابی = Σ True positive/Σ Predicted condition positive | میزان کشف اشتباه (FDR) = Σ False positive/Σ Predicted condition positive | |
پیشبینی منفی |
منفی کاذب خطای نوع دوم |
منفی صادق | False omission rate (FOR) = Σ False negative/Σ Predicted condition negative | Negative predictive value (NPV) = Σ True negative/Σ Predicted condition negative | ||
حساسیت و ویژگی (TPR), دقت و بازیابی، حساسیت و ویژگی، probability of detection, توان آماری = Σ True positive/Σ Condition positive | False positive rate (FPR), بازیابی اطلاعات، probability of false alarm = Σ False positive/Σ Condition negative | Positive likelihood ratio (LR+) = TPR/FPR | Diagnostic odds ratio (DOR) = LR+/LR− | امتیاز اف ۱ = 2 · Precision · Recall/Precision + Recall | ||
False negative rate (FNR), Miss rate = Σ False negative/Σ Condition positive | حساسیت و ویژگی (SPC), Selectivity, حساسیت و ویژگی (TNR) = Σ True negative/Σ Condition negative | Negative likelihood ratio (LR−) = FNR/TNR |
واژگان و مشتقات
ماتریس درهمریختگی
- در واقعیت درست یا (P)
- تعداد موارد واقعاً مثبت در داده
- در واقعیت منفی یا (N)
- تعداد موارد واقعاً منفی در داده
- مثبت صادق یا (TP)
- مانند آژیر درست
- منفی صادق یا (TN)
- مانند سکوت درت
- مثبت کاذب یا (FP)
- معادل با آژیر کاذب، خطای نوع اول (هواپیمای دشمن نبوده ولی آژیر زده شده)
- منفی کاذب یا (FN)
- معادل با سکوت اشتباه خطای نوع دوم (هواپیمای دشمن بوده ولی آژیر زده نشده)
- recall، sensitivity، hit rate، یا true positive rate یا (TPR)
- specificity، selectivity یا true negative rate یا (TNR)
- precision یا positive predictive value یا (PPV)
- negative predictive value یا (NPV)
- رتبه ناموجود یا false negative rate یا (FNR)
- fall-out یا false positive rate یا (FPR)
- میزان کشف اشتباه (FDR)
- false omission rate (FOR)
- Threat score (TS) یا Critical Success Index (CSI)
- صحت و دقت (ACC)
- امتیاز اف ۱
- is the میانگین همساز بازیابی اطلاعات and حساسیت و ویژگی
- Matthews correlation coefficient (MCC)
- Informedness یا Bookmaker Informedness (BM)
- Markedness (MK)
منبع: Fawcett (2006),[۳] Powers (2011),[۴] Ting (2011),[۵] and CAWCR[۶]
منابع
[ویرایش]- ↑ Stehman, Stephen V. (1997). "Selecting and interpreting measures of thematic classification accuracy". Remote Sensing of Environment. ۶۲ (۱): ۷۷–۸۹. doi:10.1016/S0034-4257(97)00083-7.
- ↑ "ماتریس اغتشاش یا ماتریس درهم ریختگی". رضا داوطلب. Archived from the original on 24 October 2016.
- ↑ Fawcett, Tom (2006). "An Introduction to ROC Analysis" (PDF). Pattern Recognition Letters. 27 (8): 861–874. doi:10.1016/j.patrec.2005.10.010.
- ↑ Powers, David M W (2011). "Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation" (PDF). Journal of Machine Learning Technologies. 2 (1): 37–63.
- ↑ Ting, Kai Ming (2011). Encyclopedia of machine learning. Springer. ISBN 978-0-387-30164-8.
- ↑ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (2015-01-26). "WWRP/WGNE Joint Working Group on Forecast Verification Research". Collaboration for Australian Weather and Climate Research. World Meteorological Organisation. Retrieved 2019-07-17.